qat

深度学习模型量化技术简介

量化（Quantization）是指将连续的高精度数值映射到离散的低精度数值的过程。量化是一种深度学习模型优化技术，它通过将模型的权重和激活值从高精度（如32位浮点数）转换为低精度（如8位整数或更低），从而减少模型的计算复杂度和存储需求，同时提高推理速度。这种

在上图中我们最直观的感受就是左右两张马里奥图像的清晰度差异，这样压缩后的图像可能会影响我们视觉的识别。换个角度，我们把AI原始模型当作是800万画素的图片，将其转换成为30万画素，同时人眼看不出差异，这个过程就完成了有效的模型压缩。